En théorie des probabilités, l'inégalité d'Efron-Stein permet de borner la variance d'une fonction générale de variables aléatoires indépendantes. Cette inégalité peut être couplée avec d'autres inégalités de concentration classiques, comme l'inégalité de Bienaymé-Tchebychev.
Soient
des variables aléatoires indépendantes à valeurs dans un espace
une fonction générale des
avec
alors
![{\displaystyle \mathrm {Var} (Z)\leq \sum _{i=1}^{n}\mathbb {E} \left[(Z-\mathbb {E} ^{(i)}[Z])^{2}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2e8b33315bc1e2f4bff72b0e0519f369f00bdcaf)
où
désigne l'espérance conditionnelle conditionnée par rapport à
, c'est-à-dire
![{\displaystyle \mathbb {E} ^{(i)}Z=\int _{\mathcal {X}}f(X_{1},\dots ,X_{i-1},x,X_{i+1},\dots ,X_{n})\mathrm {d} \mu _{i}(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/921b347df34ef6defb1f3e210872ca1beda3da08)
où
![{\displaystyle \mu _{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dea0a0293841cce9eef98b55e53a92b82ae59ee4)
est la densité de
![{\displaystyle X_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/af4a0955af42beb5f85aa05fb8c07abedc13990d)
.
Si on pose
des copies indépendantes des
et que l'on pose
![{\displaystyle Z_{i}'=f(X_{1},\dots ,X_{i-1},X_{i}',X_{i+1},\dots ,X_{n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/970395f1ffa76ce21aa102c61ada1fc5bdc99973)
,
alors le membre de droite de cette inégalité peut également s'écrire :
![{\displaystyle \sum _{i=1}^{n}\mathbb {E} \left[(Z-\mathbb {E} ^{(i)}[Z])^{2}\right]={\frac {1}{2}}\sum _{i=1}^{n}\mathbb {E} \left[(Z-Z_{i}')^{2}\right]=\sum _{i=1}^{n}\mathbb {E} \left[(Z-Z_{i}')_{+}^{2}\right]=\sum _{i=1}^{n}\mathbb {E} \left[(Z-Z_{i}')_{-}^{2}\right]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6b1edfc8f7e0288e5fb61633b5bc01790e1c45ae)
où
![{\displaystyle x_{+}=\max(x,0)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f3c374fce59a786bd300ba06972107636cb890d8)
et
![{\displaystyle x_{-}=\max(-x,0)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/524105df1a4b2bd1e11332d68a33123116ceaafd)
.
On peut également écrire que
où l'infimum est pris sur l'ensemble des
-mesurable et les variables
admettant un moment d'ordre deux.
L'idée de la preuve est de généraliser le cas où quand
, on a
[1]
Si on note
l'espérance conditionnelle conditionnée par rapport à
(avec la convention
et que l'on pose
![{\displaystyle \forall 1\leq i\leq n,\qquad \Delta _{i}=\mathbb {E} _{(i)}[Z]-\mathbb {E} _{(i-1)}[Z]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/02c798a15f3ab720ac9ace4e609b4454089d50c4)
alors
Donc
Or, si
donc
![{\displaystyle \mathbb {E} [\Delta _{i}\Delta _{j}]=\mathbb {E} \left[\mathbb {E} _{(i)}[\Delta _{i}\Delta _{j}]\right]=\mathbb {E} \left[\Delta _{i}\mathbb {E} _{(i)}[\Delta _{j}]\right]=0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4770069a801e787a67e49aad3740b21cd612418c)
On a donc à présent que
.
D'après le théorème de Fubini,
, d'où
. D'après l'inégalité de Jensen,
![{\displaystyle \Delta _{i}^{2}=\left(\mathbb {E} _{(i)}\left[Z-\mathbb {E} ^{(i)}[Z]\right]\right)^{2}\leq \mathbb {E} _{(i)}\left[\left(Z-\mathbb {E} ^{(i)}[Z]\right)^{2}\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d22f67661e88e177ae56a882b4cea5bcb3d8ba2e)
Finalement,
.
Démontrons maintenant l'égalité des termes pour le membre de droite de l'inégalité d'Efron-Stein. Si on note
la variance conditionnelle conditionnée par rapport à
alors
![{\displaystyle \sum _{i=1}^{n}\mathbb {E} \left[(Z-\mathbb {E} ^{(i)}[Z])^{2}\right]=\sum _{i=1}^{n}\mathbb {E} \left[\mathrm {Var} ^{(i)}(Z)\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/04d136eb9b2c8dfa85bb36a82185394d197d1d12)
En utilisant le fait que si
et
sont des variables aléatoires réelles indépendantes et identiquement distribuées alors
Or conditionnellement à
, les variables
et
sont indépendantes et identiquement distribuées d'où
![{\displaystyle \mathrm {Var} ^{(i)}(Z)={\frac {1}{2}}\mathbb {E} ^{(i)}\left[(Z-Z_{i}')^{2}\right]=\mathbb {E} ^{(i)}\left[(Z-Z_{i}')_{+}^{2}\right]=\mathbb {E} ^{(i)}\left[(Z-Z_{i}')_{-}^{2}\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b572441585649f43c1b90cb761ee51f574519bcc)
La dernière égalité vient du fait que l'on puisse écrire que
. Donc conditionnellement à
, on peut écrire que
![{\displaystyle \mathrm {Var} ^{(i)}(Z)=\inf _{Z_{i}}\mathbb {E} ^{(i)}\left[(Z-Z_{i})^{2}\right].}](https://wikimedia.org/api/rest_v1/media/math/render/svg/847cbf523b5c540e1b3bca6d30097274437db35e)
Une fonction
possède la propriété de différences bornées s'il existe des constantes positives
tels que
![{\displaystyle \forall 1\leq i\leq n,\qquad \sup _{x_{1},\dots ,x_{n},x_{i}'\in {\mathcal {X}}}|f(x_{1},\dots ,x_{n})-f(x_{1},\dots ,x_{i-1},x_{i}',x_{i+1},\dots ,x_{n})|\leq c_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3513750cfd9c18103f07614de9c581b172f030a6)
Si une fonction
vérifie cette propriété avec les constantes
, alors d'après l'inégalité d'Efron-Stein[1] et parce que
pour
, on a
![{\displaystyle \mathrm {Var} (Z)\leq {\frac {1}{4}}\sum _{i=1}^{n}c_{i}^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e601873b0dfb64660000e132c9fa40a03fccd383)
On dit qu'une fonction positive
est auto-bornée s'il existe des fonctions
tels que pour tout
et tout
,
![{\displaystyle 0\leq f(x_{1},\dots ,x_{n})-f_{i}(x_{1},\dots ,x_{i-1},x_{i+1},\dots ,x_{n})\leq 1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/30465a8d17ca0312238f629ac2f503a0255483bd)
et
![{\displaystyle \sum _{i=1}^{n}(f(x_{1},\dots ,x_{n})-f_{i}(x_{1},\dots ,x_{i-1},x_{i+1},\dots ,x_{n}))\leq f(x_{1},\dots ,x_{n}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/aa437de8cda42d443d0981874899c79570ec75c9)
D'après l'inégalité d'Efron-Stein, toute fonction
auto-bornée vérifie
.
- ↑ a et b (en) Stéphane Boucheron, Gabor Lugosi et Pascal Massart, Concentration inequalities: A Nonasymptotic Theory of Independence, OUP Oxford, 496 p. (ISBN 019876765X)